声明

本文是学习GB-T 35048-2018 法庭科学语音及音频检验术语. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们

1 范围

本标准界定了法庭科学语音及音频检验鉴定及其相关活动的术语和定义。

本标准适用于法庭科学领域中的语音及音频检验鉴定,其他领域可参照使用。

2 规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文

件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

GB/T 2900.75—2008 电工术语 数字录音和录像

GB/T 2900.76—2008 电工术语 音频和视频的记录与重放

GB/T 3791—1999 盒式录音磁带尺寸及机械特性

GB/T 3947—1996 声学名词术语

3 术语和定义

GB/T 2900.75—2008、GB/T 2900.76—2008、GB/T 3791—1999、GB/T 3947—1996
界定的以及下 列术语和定义适用于本文件。为了便于使用,以下重复列出了GB/T
2900.75—2008、GB/T 2900.76—

2008、GB/T 3791—1999、GB/T 3947—1996 中的某些术语和定义。

3.1 语言学、语音学

3.1.1

爆发音 plosive

根据发音方式不同而划分出来的一类辅音。发音时,先是相关部位完全阻塞,导致其后形成高压气

流,然后突然打开声道,让高压气流爆发释放而成音。

3.1.2

vernacular

一个国家或地区的非标准化的民族语言或方言。

3.1.3

本调 basic tone

与"变调"相对。方言中原本的声调调值。大多是汉字独用时的单字调。

3.1.4

鼻共振 nasal resonance

发音时气流通过鼻腔产生的共振。

3.1.5

鼻化 nasalization

一种语流音变现象。发音时,由于软腭下垂,气流由鼻腔和口腔同时流出,引起口腔和鼻腔两种共

GB/T 35048—2018

鸣,而使原来的口腔音带有鼻音色彩的现象。

3.1.6

鼻化元音 nasal vowel

元音发音时软颚下垂,气流同时从鼻腔和口腔逸出,并伴以鼻共振。

3.1.7

鼻音 nasal

根据发音方式不同而划分出来的一类辅音。发音时,口腔某处完全闭塞,使气流无法通过,同时软

腭下垂,使气流只从鼻腔流出。

3.1.8

鼻韵母 nasal final

含有鼻音韵尾的韵母。

3.1.9

边音 lateral

根据发音方式不同而划分出来的一类辅音。发音时,舌头上顶,在口腔中线造成阻塞,但舌头一侧

或两侧开放,让气流从舌边通过。

3.1.10

变调 changed tone

与"本调"相对。声调发生变化而派生出来的调值。

3.1.11

标音 transcription

使用音标符号系统来标记语音。可分为音位标音和语音标音。

3.1.12

不送气 unaspirated

与"送气"相对。塞音或塞擦音在除阻之后没有一股不带声的气流呼出,而是紧接着就发出元音。

3.1.13

不圆唇 unrounded

发音时,双唇保持自然状态,或展开呈扁平状。

3.1.14

擦音 fricative

根据发音方式不同而划分出来的一类辅音。发音时,发音部位不完全闭合,气流从狭缝中摩擦

而出。

3.1.15

差异 variation

语言项目在实际话语中存在的不同。

3.1.16

颤音 trill

根据发音方式不同而划分出来的一类辅音。发音时,
一个具有弹性的发音器官(如双唇、舌尖和小

舌等)在伯努利效应和肌肉弹性的作用下,反复快速地碰撞另一个具有弹性或硬性的发音器官。

3.1.17

超音段 suprasegment

那些作用范围大于音段的语音成分。例如重音和声调等。超音段成分基本上等同于韵律成分。

GB/T 35048—2018

3.1.18

冲直条 spike

爆发音的一种声学表现。在宽带语图上表现为一条较窄的竖条。

3.1.19

单元音 monophthong

与"复合元音"相对。发音过程中,舌位、唇形和开口度等基本保持不变,音质无明显变化的元音。

3.1.20

单韵母 simple final

由单元音构成的韵母。

3.1.21

地方话 local dialect

方言区内部划分出来的通行范围更小的话。例如吴语区的上海话、青浦话等。

3.1.22

地方普通话 regional common language

带有地方口音或者方言成分的普通话。地方普通话往往是方言区的人们因交际需要长期使用而形

成的。

3.1.23

调类 tonal category

声调的类别。例如,普通话分阴平、阳平、上声和去声四个调类。

3.1.24

调值 tonal value

用来描写声调的高低、升降、曲直、长短等音高特性以区分调类的数值或数值序列,它在一定程度上

反映着声调的实际读法。

3.1.25

儿化 rhotacize

一种语音变化现象。卷舌词尾"儿"同其前面音节相结合而形成儿化韵。

3.1.26

儿化韵 rhotacized final

发生儿化音变的韵母。

3.1.27

耳语声 whisper

一种发声类型。发声时,声门前部(韧带)完全靠拢,后部(勺状软骨)有一个三角形裂隙,气流通过

开放区发出摩擦噪声。

3.1.28

二合元音 diphthong

含有两个目标舌位的复合元音。

3.1.29

发声 phonation

在气流的作用下,喉部产生语音声源的行为。

3.1.30

发声类型 phonation type

在言语产生过程中,为调音器官提供声源的声门活动类型。包括正常嗓音、气嗓音、嘎裂声、假声、

GB/T 35048—2018

耳语声等。

3.1.31

发音 articulation

指应用声门以上声道的发音器官构成语音的过程。也指某些特定语音的发出过程中,发音器官的

姿势和运动状况;该定义多用于辅音,有时也用于元音的发声。

3.1.32

发音部位 place of articulation

发辅音时,主动发音器官和被动发音器官的成阻部位。

3.1.33

发音方式 manner of articulation

发辅音时,发音器官的活动方式。根据发音方式不同,辅音可分为爆发音、鼻音、颤音、拍音、擦音、

边擦音、近音、边近音等类型。

3.1.34

发音器官 vocal organ

人体中与发音过程有关的生理器官。包括肺、气管、喉、咽、口、鼻、声带、硬腭、软腭、舌、齿、唇等。

3.1.35

发音语音学 articulatory phonetics

语音学的一个分支。研究人类发音器官是如何产生语音的。

3.1.36

anti-resonance

声学语音学中,指某些声腔(例如鼻腔等)的滤波作用,它吸收和减弱语音中某些频率成分的能量。

3.1.37

anti-formant

某些声腔具有反共振作用,使得系统能量被吸收、减弱的频率范围。在语图上表现为一片白色

区域。

3.1.38

overtone

与"基音"相对。周期性复合音(例如元音)中除了基音以外的其他分音,其频率是基频的整数倍。

3.1.39

方言 dialect

一个语言的地域性变体,是相对于共同语或标准语而言的。

3.1.40

方言地图集 dialect atlas

根据方言特征或分区等内容绘制成的地图集。大致分为方言特征分布图、方言分布和分区地图两

种类型。

3.1.41

方言区 dialect group

方言分区系统中最高一层的区划。例如官话方言区、吴语区。

3.1.42

方言特征 dialectal characteristic

能够用来区分不同方言区的语言特征。往往具有对外排他性,对内一致性的主要特点。根据语言

GB/T 35048—2018

内部的结构,可以分为方言语音特征、词汇特征和语法特征。

3.1.43

分音 partial

通过傅里叶分析的方法,从一个周期性复合音里分解出来若干个具有一定频率和振幅的纯音。

3.1.44

辅音 consonant

发音时,气流在声门以上的声道某处受到阻塞或阻碍的音。

3.1.45

复合音 complex sound

与“纯音”相对。具有复合波形的声音。所有的语音都是复合音。

3.1.46

复合元音 compound vowel

与"单元音"相对。同一音节内音质发生变化的元音。可分为二合元音和三合元音。

3.1.47

复合元音韵母 diphthongal final

由复合元音构成的韵母。

3.1.48

复合韵母 compound final

由复合元音或元音带鼻音韵尾构成的韵母。普通话共有29个复合韵母,包括13个复合元音韵母

和16个鼻韵母。

3.1.49

嘎裂声 creaky voice

一种发声类型。发声时,声带从后部到中前部都不振动。只有前部一小段振动,频率极低(男声约

20 Hz~50 Hz),且不规则。

3.1.50

共鸣腔 resonant cavity

语音学中主要指口腔、鼻腔和咽腔。这些共鸣腔以其不同的形状和大小起到调音作用,从而产生不

同的语音。

3.1.51

resonance

一种物理现象。每个物体或系统在自由振动情况下都存在某个或某些频率比其他频率更容易产生
振动的自然频率,在受迫振动时,当外部驱动频率接近于一个物体或系统的自然频率时,该物体或系统

就会以最大的振幅来回振动。

3.1.52

共振峰 formant

声道共振使得语音能量在某个或某些频带中得到加强,形成语音能量聚集的一种声学表现。

3.1.53

共振峰带宽 formant bandwidth

一个语音学参量,它是以共振峰峰值以下3 dB
处的宽度来定义的,能够反映出发音时声音能量在

声道中吸收程度。

GB/T 35048—2018

3.1.54

共振峰模式 formant pattern

元音前几个共振峰频率的相对位置和关系。

3.1.55

共振峰频率 formant frequency

共振峰中心位置的频率值。在二维离散频谱上是共振峰谐波群的权重中心位置的频率值。在三维

频谱上是共振峰横杠的中心位置的频率值。

3.1.56

共振峰强度 formant intensity

共振峰的能量,用 dB 表示。

3.1.57

国际音标 International Phonetic Alphabet;IPA

国际通行的一种标记的符号体系。由国际语音教师协会(后改名为国际语音学协会)于1888年制
定发表。现在采用的是2005年修订后的版本,包括辅音、元音、附加符、超音段、声调和词重调等音标

符号。

3.1.58

过渡 transition

发音时发音器官从一个相对稳定位置向另一个位置的任何移动及这种移动所引起的声学效应,特

别是语图中显现的各共振峰的轨迹。

3.1.59

过渡音征 transition cue

元音与辅音相接(CV 或 VC)
时,由于受辅音的发音部位影响,使元音起始或末尾的一小段与辅音

邻接的共振峰表现出的某些反映辅音发音部位的征兆。

3.1.60

汉语方言 Chinese dialect

汉民族语言的地域性变体。汉语方言的内部在语音、词汇、语法方面都有自己的特点。《中国语言

地图集》把汉语方言分为官话、晋、徽、吴、湘、赣、客家、平话、粤、闽等十个方言区。

3.1.61

hertz

Hz

频率的计量单位。为纪念德国物理学家海因里希 ·赫兹(Heinrich
Hertz)而命名,符号为 Hz, 汉语

简写成"赫"。

3.1.62

喉音 laryngeal

根据发音部位的不同而划分出来的一类辅音。是一种发音部位在喉部、以声门收紧为主构成阻碍

而发出的音。

3.1.63

假声 falsetto

一种发声类型。发声时,声带拉紧,边缘变薄,声门微微打开,基频比正常嗓音高很多。

3.1.64

deletion

一种语流音变现象。在语音串里原来存在的某个音段在语流中被减省或丢失。

GB/T 35048—2018

3.1.65

节奏 rhythm

在言语中突显要素有规则地间隔出现所产生的听觉模式。这些突显要素可能是重音、音节或莫拉

等,主要通过这些要素规律性的音高、时长变化或停顿分布得以实现。

3.1.66

口吃 stuttering

说话时字音重复或词句中断的现象,是一种习惯性的语言缺陷。

3.1.67

口音 accent

表现说话人的方言特点的发音,是一种地域的语音特征。

3.1.68

宽带语图 wide-band spectrogram

用宽带滤波器(带宽通常为300 Hz)
和相应的高速采样分析所得的三维语图。常用于音色分析。

3.1.69

俚语词 slang

流行于民间的、俚俗的地域口语词。通常用于非正式场合。具有通俗性、口语性和地域性等特点。

3.1.70

连读变调 tone sandhi

一种语流音变现象。在连续语流中,由于受相邻音调的影响而发生的声调变化。

3.1.71

零声母 zero initial

当韵母自称音节时,声母的位置上没有音位性的辅音成分。

3.1.72

乱纹 fill

在宽带语图上表现出来的一片杂乱的状似雨消的纹样。是擦音和送气在语图上的典型特征。

3.1.73

母语 mother tongue

人在幼儿时期自然习得的语言。第一语言。

3.1.74

frequency

同样模式的波形在单位时间(每秒)内重复出现的次数。

注:单位是赫兹(Hz)。

3.1.75

谱包络 spectral envelope

在声谱(幅度谱)中把各频率分量的振幅顶点顺势连接起来,以表示频谱大体趋势的曲线。

3.1.76

气嗓音 breathy voice

一种发声类型。发声时,喉部肌肉张力很小,声带振动,但不完全闭合,气流量较大,从而产生一种

"呼吸音"或“叹气音"的嗓音音色。

3.1.77

轻声 neutral tone

汉语中有些汉字或音节自身没有声调或失去了原有的声调,音高随前后音节的声调而变化的现象。

GB/T 35048—2018

轻声音节通常会读得短而弱。

3.1.78

清辅音 voiceless consonant

辅音的一个音系类别,发音时声带不振动的辅音。

3.1.79

清化 devoicing

一种语流音变现象。浊辅音或元音的浊音色彩消失而变读为清辅音或清元音。

3.1.80

塞擦音 affricate

根据发音方式不同而划分出来的一种先塞后擦的辅音。

3.1.81

三合元音 triphthong

含有三个目标舌位的复合元音。

3.1.82

嗓音 voice

任何一种包含声带振动的发声类型。正常嗓音。

3.1.83

嗓音横杠 voice bar

浊辅音的标志。发浊辅音时,常会在低频区(200 Hz
附近)形成一条能量聚集区,而在高频区没有

能量表现。

3.1.84

嗓音起始时间 voice onset time;VOT

从塞音和塞擦音的除阻起始点到声带振动起始点之间所经历的时间。其值可正可负。

3.1.85

嗓音音质 voice quality

个人嗓音的特殊的听觉色彩,它来自喉和喉上部特征差异,并贯穿个人言语行为的始终。

3.1.86

社会方言 social dialect;sociolect

与说话人的社会身份(例如年龄、性别、职业、教育程度)有关的语言变体。

3.1.87

声带 vocal cord

伸展于喉头前部的甲状软骨与后部的两块勺状软骨之间的两片带状肌肉组织,两者相对的边缘为

游离于声门中的纤维质薄膜。其横断面呈三角形。

3.1.88

声道 vocal tract

发音过程中的整个气流通道。包括气管和声门以上的口腔、鼻腔和咽腔。

3.1.89

tone

字词层面具有区分字词意义功能的音高对比模式。

3.1.90

声门 glottis

两片声带当中的开口。声带静止不发音时,从上往下,自前往后看,声门应该是呈倒
V 字形。可分

GB/T 35048—2018

为音声门和气声门。

3.1.91

声母 initial

汉语音节结构的起首成分。由辅音构成。可分为清声母、浊声母和零声母。

3.1.92

声谱 sound spectrum

反映声音频谱特性的图形。常见的是幅度谱,其横轴标示频率,纵轴标示振幅,展示复合音的各分

音频率及其振幅。幅度谱可分为离散谱和连续谱。

3.1.93

声谱分析 sound spectral analysis

分析声音频谱特性的过程。其结果通常以声谱图来显示。

3.1.94

声谱仪 sound spectrograph

一种用于观察和分析声音的频谱特性的仪器。

3.1.95

声学语音学 acoustic phonetics

语音学的一个分支。主要研究语音的物理性质。

3.1.96

声学元音图 vowel chart

一种用于表明元音声学空间的元音位置的图形。通常根据元音的第一共振峰和第二共振峰的频率

值来定位。

3.1.97

声源 source

声学语音学中,为语音产生提供能量的源泉。

3.1.98

时长 length;duration

发某个音段或语音成分所用的时间。由声波持续的时间长短决定,以 s 或 ms
为单位。

3.1.99

实验语音学 experimental phonetics

利用仪器设备、通过实验的方法和手段进行研究的语音学。

3.1.100

送气 aspirated

与"不送气"相对。塞音或塞擦音在除阻之后没有一股不带声的气流呼出,而是紧接着就发出元音。

3.1.101

停顿 pause

言语过程中出现的短暂中断。

3.1.102

同化 assimilation

一种语流音变现象。语流中两个原本不相同或不相近的音在发音时相互影响,导致这两个音变得

相同或相似。

GB/T 35048—2018

3.1.103

五度标调法 five-letter tone system;a system of
tone-letters

由赵元任先生提出的用五个音高来度量和标记声调的方法。五个音高等级用“1、2、3、4、5”来标记,

分别表示"低、半低、中、半高、高"。

3.1.104

习惯语 social idiom

各种社会集团、职业集团以及不同阶层内部使用的词语。包括术语、行业语、集团语、阶级语等。

3.1.105

协同发音 coarticulation

不同发音器官之间运动相互影响的方式,以及某个发音器官的发音受到前后发音器官影响的方式。

3.1.106

谐波 harmonic

在周期性复合音中,任何为基频整数倍的频率成分。

3.1.107

言语产生 speech production

语音产生的全部活动。包括大脑和神经系统的作用以及发音器官的活动。发音器官的活动,主要

分为四个方面:动力(气流)、声源、共振和辐射。

3.1.108

言语感知 speech perception

听音人从言语声中提取对应的语言学要素的过程。

3.1.109

央化 centralization

一种语流音变现象。前元音和后元音在发音时舌位向中央位置靠拢。

3.1.110

异化 dissimilation

一种语流音变现象。语流中两个原本相同或相近的音在发音时相互影响,导致这两个音变得不相

同或不相似。

3.1.111

音渡 juncture

两个音位之间的界限,构成了言语的语音间的流动和暂停。

3.1.112

音段 segment

语音学中, 一个离散的语音单位。

3.1.113

音高 pitch

声学语音学中,语音频率的知觉相关物。频率越高,则音高也越高,但它们的关系是非线性的。主

要取决于声带的振动频率,即基频。

3.1.114

音轨 locus

元音与辅音相邻出现(CV 或 VC)
时,元音起始或末尾的一小段与辅音邻接的元音共振峰可能会发

生弯曲,指向所邻接辅音的某个频率位置。

GB/T 35048—2018

3.1.115

音节 syllable

能够自然发出和察觉到的最小语音单位。

3.1.116

音强 intensity

语音的强弱。主要取决于发音时声门下压力的大小,也跟声腔共鸣特性有关。

3.1.117

音色 timbre

声音频谱的知觉特性。

3.1.118

音素 phone

音位在具体环境里的语音实现。
一个音位可能实现为一个或多个音素。可分为元音和辅音两

大类。

3.1.119

音位 phoneme

特定语言的语音系统中最小的对立单位,能够区分意义的最小语音单位。最重要的特性是它与该

语音系统中的其他音位相对立。

3.1.120

音位变体 allophone

一个音位在各类语音环境中表现出来的两个或多个语音上不同的音素。可分为自由变体和条件

变体。

3.1.121

音位标音 phonemic transcription

与"语音标音"相对。主要根据语音的音系学功能来标记语音的音位类别。

3.1.122

音位分析 phonemic analysis

将一种语言的单词和语音进行分类,弄清哪些是该语言中有区别性的语音单位(音位),哪些只是这

些语音单位的变体。

3.1.123

语流音变 contextual variation

受前后语音环境、轻重、语速等音素的影响而发生的语音变化现象。常见的语流音变现象有增音、

减音、同化、异化等。

3.1.124

语速 speech rate

一段话的整体发音速度。通常用每秒多少个音节来表示。

3.1.125

语图 sound spectrogram;sonagram

反映声音的频谱能量随时间变化的三维图形。其中横轴标示时间,纵轴标示频率,并用颜色的深浅

来标示强弱。

3.1.126

semanteme

语言的意义。通过语言的语素、词、短语、句子、语段,以及这些单位的组合表达出来。

GB/T 35048—2018

3.1.127

语音标音 phonetic transcription

与"音位标音"相对。主要根据语音的物理和听觉特性来标记语音。

3.1.128

语音学 phonetics

研究人类语音产生、传递和感知的科学。

3.1.129

元音 vowel

发音时,气流在声门以上的气流通道内可以自由流通的音。

3.1.130

元音融合 synaloepha

一种语流音变现象。当两个元音分别出现在前一词的末尾和后一词的起始位置时,其中一个元音

被省略,把跨越词界的两个音节合并为一个音节。

3.1.131

元音音质 vowel quality

某个元音的区别特征的全集,是由发音时的舌位和唇形决定的。不包括音高、音强、音长及发音

类型。

3.1.132

韵律特征 prosodic feature

在某种特征系统中为了处理那些涉及比音段大的单位之间的对立所需要的任何区别特征。主要指

音高、音长和音强等方面的语音特征。

3.1.133

final

汉语音节结构中声母之后的所有音段成分。可以分为单韵母和复合韵母。

3.1.134

增音 epenthesis;insertion

一种语流音变现象。在语流中增添一些语音串里原来没有的音素。

3.1.135

窄带语图 narrow-band spectrogram

用窄带滤波器(带宽通常为45 Hz)
和相应的低速采样做成的三维语图。常用于音高分析。

3.1.136

振幅 amplitude

振动过程中,振动物体离开平衡位置的最大距离。 A(t)=Asin(wt+0) 式中A
为振幅。

3.1.137

正常嗓音 modal voice

一种发声类型。发声时,声门作为一个单一的整体起作用,声带有规律地振动,并且每个周期完全

闭合,没有任何摩擦噪声。

3.1.138

重音 stress

音节的相对突显程度。

GB/T 35048—2018

3.1.139

周期 period

t

周期波中,同样模式的波形重复出现一次所需的时间。

注:单位是秒(s)或毫秒(ms)。

3.1.140

浊化 voicing

一种语流音变现象。清辅音在语流中变读为浊辅音。

3.1.141

自由变体 free variation

属于同一个音位且可以在相同的语音环境中互相替换的两个音素。

3.2 声学及信号处理

3.2.1

白噪声 white noise

用固定频带宽度测量时,频谱连续并且均匀的噪声。白噪声的功率谱密度不随频率改变。

[GB/T 3947—1996,定义2.13]

3.2.2

贝叶斯判别规则 Bayes decision rule

统计学中的一个规则。用该规则进行分类时要求各类别总体的概率分布是已知的,并且要决策分

类的类别是一定的。

3.2.3

倍频程 octave

一种计量音高间距的单位。如果两个频率之比(高频除以低频)等于2,则二者的音高音距为1个

倍频程。1个倍频程等于12个半音。

3.2.4

闭集 closed set

说话人自动识别系统的一种条件,需要鉴别的说话人一定在已知样本库中。

3.2.5

波长 wavelength

λ

周期波在一个周期之内传播的距离。

3.2.6

波形 waveform

声学语音学中,把说话引起的空气质点的振动位移绘制成随时间变化的图形,用来表示言语波的

形状。

3.2.7

采样 sampling

在时间域上对连续信号离散化。

3.2.8

采样速率 sampling rate

每秒采样所取得的数字样本数,采样理论表明,为了能没有混叠地恢复原模拟信号,采样频率必须

GB/T 35048—2018

大于信号最高频率的两倍。

[GB/T 2900.75—2008,附录 A A-01-29]

3.2.9

插入式耳机 insert earphone

可以把一部分装在外耳道内的小型耳机。

3.2.10

长时频率分析 long-term frequency analysis

在几个音调周期的时间长度上对语音信号作频率分析。

[GB/T 3947—1996,定义6.44]

3.2.11

纯音 pure tone

有单一音调的声波。

[GB/T 3947—1996,定义11.4]

3.2.12

倒[频]谱 cepstrum

信号的[频]谱的对数。

3.2.13

等响曲线 equal loudness contour

人类的听音特性曲线,是反映人们对声音振幅范围心理和生理因素的曲线,每条曲线上对应于不同

频率的声压级是不相同的,但人耳感觉到的响应却一样。

3.2.14

短时频率分析 short-time frequency analysis

在几毫秒至二、三十毫秒的时间对语音信号作频率分析。由于声道的缓变性,可认为其声道处于

稳态。

[GB/T 3947—1996,定义10.45]

3.2.15

放声 sound reproduction;playback

把贮存起来的能量重新转换为声能后放出来的技术。

[GB/T 3947—1996,定义6.82]

3.2.16

分贝 decibel;dB

一种级的单位,
一个量与同类基准量之比的以10的10次方根为底的对数值为1时称为1dB。

[GB/T 3947—1996,定义2.45]

3.2.17

傅里叶分析 Fourier analysis

一种把复合波分解成为若干具有一定频率和振幅的正弦波的数学方法。

3.2.18

过零率 zero-crossing rate

在单位时间内, 一段语音波形中信号通过零点的次数。

GB/T 35048—2018

3.2.19

哈明窗 Hamming window

又称汉明窗,余弦窗函数,其表达式为:

(n)=0.54-0.46cos(2πn/N), 式中n=0,1,…,N-1。

[GB/T 3947—1996,定义14.26]

3.2.20

汉宁窗 Hanning window

余弦平方窗函数,其表达式为:

w(n)=0.54-0.5cos(2πn/N), 式中n=0,1,…,N-1。

[GB/T 3947—1996,定义14.27]

3.2.21

回声 echo

大小和时差都大道足以能和直达声区别开的反射声或由于其他元音返回的声。

注:有时泛指反射声。

[GB/T 3947—1996,定义2.71]

3.2.22

混响 reverberation

声源停止发声后,声音由于多次反射或散射而延续的现象,或者声源停止发声后,由于多次反射或

散射而延续的声音。

[GB/T 3947—1996,定义2.70]

3.2.23

基频 fundamental frequency

fo

基音的频率。

3.2.24

激光唱片 compact disc;CD

用激光束直接记录声频编码信号、并用激光反射方式拾取信号的唱片。

[GB/T 3947—1996,定义6.108]

3.2.25

降噪量 noise reduction

降低噪声的程度,用分贝数表示。

3.2.26

精确率 precision

在信息检索、模式识别等领域中用于测试系统性能的指标。

3.2.27

矩形窗 Rectangular window

在窗内对所有的样值都给以同等计权的窗函数。表达式为w(n)=1,
式中n=0,1,…,N-1。

3.2.28

拒识率 rejection rate

没有被识别的输入模式的数量占被识别的所有输入模式的总数的百分比。

GB/T 35048—2018

3.2.29

开集 open set

说话人自动识别系统的一种条件,不确定被鉴定人是否存在于已知样本库中。

3.2.30

快速傅里叶变换 fast Fourier transform;FFT

运用数据组和碟形运算,可大大减少运算量的求傅里叶系数的速算程序。

3.2.31

离散傅里叶变换 discrete Fourier transform

用于有限时间序列的一种运算函数。有限时间序列x(n) 的傅里叶变换是

style="width:3.73336in;height:0.73348in" />,式中k=0,1, …,N- 1。

3.2.32

量化 quantization

用整数标度将一个连续的数值范围区分为一 定量的离散值。

3.2.33

录音 sound recording

把声能转换为其他形式的能量并加贮存的技术。

[GB/T 3947— 1996,定义6 .81]

3.2.34

录音电平自控制 Automatic Level Control;ALC

解决音频系统对声音动态范围限制的方法之一
,通过对声音信号强度进行压缩,使其处在记录设备

的动态范围之内。

3.2.35

录音机背景噪声 recorder noise

录音过程中录音机自身产生的噪声,与外界声音信号无关。

3.2.36

滤波器 filter

数字滤波器 digital filter

把信号中各分量按频率加以分离的设备。能使 一
个或几个频带中的信号分量通过时基本不受衰

减,对其他频带中的分量则加以衰减。按其频率特性分为低通、高通、带通、带阻等类型。

[GB/T 3947— 1996,定义6.49]

3.2.37

脉冲编码调制 Pulse Code Modulation;PCM

将信号以等时间间隔采样、量化并用二进制码编码。

3.2.38

美尔频率倒谱系数 Mel-Frequency Cepstral Coefficient;MFCC

Mel 频率的倒谱系数 MFCC
是根据人类听觉系统的特性出现的,人耳分辨声音频率的过程就像一
种取对数的操作。 MFCC 的计算首先用FFT
将时域信号转化成频域,之后对其对数能量谱用依照 Mel
刻度分布的三角滤波器组进行卷积,最后对各个滤波器的输出构成的向量进行离散余弦变换,取前
N

个系数。

GB/T 35048—2018

3.2.39

模拟信号 analog signal

声学中一个连续变化的信号。

3.2.40

模式识别 pattern recognition

利用计算机或其他装置对物体、自然景物、人像、图片、语音、声音、文字、字符以及其他信息模式进

行自动识别的过程。

3.2.41

模数转换 analogue to digital conversion

A/D 转换 A/D conversion

将模拟信号转换成数字信号。

3.2.42

奈奎斯特定理 Nyquist theorem

对任一最高频率为f。的时间信号进行采样时,其采样周期至少应小于1/(2,fo),才能根据采到的

样值序列重建信号。

3.2.43

匹配 matching

测试两个数据项是否相等或查找一个与关键字完全相同的数据项的过程和方法。

3.2.44

平均语音功率 average speech power

瞬时语音功率在一定时间内的平均值。

3.2.45

全球移动通信系统 Global System for Mobile
Communications;GSM

一个根据欧洲电信标准协会出版的GSM 技术规范建造的国际无线蜂窝网。

3.2.46

声强 sound intensity

声场中某点处,与质点速度方向垂直的单位面积上在单位时间内通过的声能。表达式为
I(t)=

p(t) ·u(t),式中 I 为声强。

注:稳定声场中,声强 I
为瞬时声强在一定时间内的平均值。单位为瓦每平方米(W/m²)。

[GB/T 3947—1996,定义2.26]

3.2.47

时间窗 time window

在对信号进行分析处理时,用一定计权方式截取一段时间信号。常用的时间窗有:矩形窗、汉宁窗

和汉明窗。

3.2.48

受话器 telephone receiver

电话系统中使用的耳机。

[GB/T 3947—1996,定义6.45]

3.2.49

数模转换 digital to analogue conversion

D/A 转换 D/A conversion

将数字信号转换成模拟信号。

GB/T 35048—2018

3.2.50

数字信号 digital signal

在时间上和幅度上都是离散的信号。

3.2.51

数字信号处理 Digital Signal Processing;DSP

用数字技术对信号进行采集、存储、传输、变换等的方法和技术。

3.2.52

瞬时语言功率 instantaneous speech power

语言源在某一瞬时辐射的声功率。

3.2.53

说话人辨认 speaker identification

根据语音从一些说话人中辨认出某人。

3.2.54

说话人确认 speaker verification

根据某人语音证实为该人。

3.2.55

送话器 telephone transmitter

电话系统中使用的传声器。

3.2.56

特征提取 feature extraction

从信号中分析获得特征参数。

3.2.57

特征向量 feature vector

在模式识别的特征空间中代表样本的向量,该向量具有若干个特征分量,表示样本的若干属性

特征。

3.2.58

误识率 error rate

被误识的输入模式的数量占被识别的所有输入模式的总数的百分比。

3.2.59

线性预测 linear prediction

用信号在某时刻以前的样值的线性组合来计算信号在该时刻的值的方法。

3.2.60

线性预测编码 linear prediction coding;LPC

一种最基本的低速率语音编码方法,LPC
语音编码的基础是语音产生模型,在这个模型中,语音是
由激励信号激励一个LPC 滤波器而产生。 LPC
滤波器的参数是通过线性预测的方法,即用过去的样

值预测当前样值提取的。

3.2.61

线性预测倒谱系数 Linear Prediction Cepstral
Coefficient;LPCC

利用同态处理方法,对语音信号求离散傅里叶变换后取对数,再求反变换就可得到倒谱系数。对
LPC
倒谱,在获得滤波器的线性预测系数后,可以用一个递推公式计算得出。实验表明,使用倒谱可以

提高特征参数的稳定性。

GB/T 35048—2018

3.2.62

信号 signal

在利用声波或电子技术进行信息的传播和重建过程中,有意要传输和重建的信息。它与伴随的噪

声相对。

3.2.63

扬声器 loudspeaker

把电能转换为声能并在空气中辐射到远处的电声换能器。

[GB/T 3947—1996,定义6.36]

3.2.64

音调 tone

听觉判断声音高低的属性,根据它可以把声音排成由低到高的序列,音调的单位是mel。

3.2.65

volume

一个复杂的声频信号在一标准的声量指示器上在该点量得的值。用分贝(dB)
表示。

3.2.66

隐马尔可夫模型 Hidden Markov Model;HMM

有关随机序列的一种统计模型。是马尔可夫链模型的扩展。该模型由两个随机变量序列组成:

个是观测不到的马尔可夫链,另一个是可以观测到的随机序列。

3.2.67

intonation

以音调或旋律表示的超音段语音特征。在语言中起多种作用,最重要的作用是语法结构,可起到类

似标点的作用。

[GB/T 3947—1996,定义10.18]

3.2.68

语言识别 language recognition

机器根据语音特征参数和语法规则识别语言。

[GB/T 3947—1996,定义10.48]

3.2.69

语音分析 speech analysis

提取语音信号特征参数。

[GB/T 3947—1996,定义10.43]

3.2.70

噪声 noise

由非周期波引起的声音,其频谱表现为连续谱。

3.2.71

召回率 recall

在信息检索、模式识别等领域中用于测试系统性能的指标。

3.2.72

字节 byte

由8比特构成的数据或数据存储空间的一种单位,通常表示一个字符。数字数据存储量通常以字

节(B)、千字节(kB)、 兆字节(MB) 为单位。

GB/T 35048—2018

[GB/T 2900.75—2008,附录 A A-01-05]

3.3 声纹检验

3.3.1

背景噪声 background noise

由外界环境引起的与目标语音无关的声音。

3.3.2

被叫方 called party

通话双方接受呼叫的用户;接电话人。

3.3.3

本底噪声 ground noise

录音、录像设备自身结构所产生的与信号无关的噪声。

3.3.4

本质差异 essential difference

说话人自身因素所表现出来的与其正常的发音在语音声学特征上的不同。

3.3.5

错误否定 false negative

将同一说话人的语音错判为不同说话人的语音。

3.3.6

错误认定 false positive

将不同说话人的语音错判为同一说话人的语音。

3.3.7

动态范围 dynamic range

信号最强的部分与最微弱部分之间的电平差。动态范围越大,强声音信号就越不会发生削波失真。

3.3.8

动态特征 dynamic characteristic

复合元音的语音变化特征,发音过程中由于调音音质不断变化而形成的共振峰动态模式。

3.3.9

防消盖 anti-erasing lid

为防止误消磁而置于防消孔上的小盖,存在时可以记录,除去后可使防消孔起作用。

3.3.10

防消孔 anti-erasing hole

磁带盒后面防误消磁的识别孔。

3.3.11

防消片 anti-erasing lug

置于防消孔中的小片,存在时可以记录,除去后可使防消孔起作用。

3.3.12

非本质差异 nonessential difference

说话人非自身因素所表现出来的与其正常的发音在语音声学特征上的不同。

3.3.13

盒式录音带 cassette

带盒尺寸为102 mm×64 mm×12 mm,磁带宽为3.81 mm 的盒装录音带。

GB/T 35048—2018

3.3.14

检材 questioned recording

需要鉴定的录音资料和录像所含的音频资料。

3.3.15

检材录制/拍摄设备 recording equipment of
audio/video material

录制/拍摄原始检材的录音、录像设备。

3.3.16

检材语音 questioned voice

检材中需要鉴定的语音。

3.3.17

降噪 noise reduction

清除、降低噪声的过程。

3.3.18

可听声 audible sound

人耳可以听到范围的声音。 一般人耳可听声的频率范围为20 Hz~20 kHz。

3.3.19

空白磁带 blank tape

尚未磁化过或已完全消磁的磁带。

[GB/T 2900.76—2008,定义806-15-13]

3.3.20

录音处理 enhancement of audio recording

通过技术处理,改善声音听觉效果或声谱效果的处理方式。

3.3.21

录音的真实性鉴定 audio authentication

通过技术手段判断检材语音是否剪辑处理。

3.3.22

录音内容辨听 audio interpretation

通过听辨,必要时借助录音处理等技术手段,书面整理录音资料所反映的语音内容。

3.3.23

模仿语音 imitated voice

说话人故意发出的与目标语音相同或相近的语音。

3.3.24

声称的检材录制/拍摄设备 alleged recording equipment
of audio/video material

检材提交方(录制/拍摄方)声称的录制/拍摄检材的设备。

3.3.25

声称的原始音频资料 alleged original audio material

检材提供方(录制/拍摄方)声称的原始录音、录像的资料。

3.3.26

声谱图 spectrogram

用多种方式分析显示出来的具有动态变化特性的声音信号的图谱。

GB/T 35048—2018

3.3.27

声纹 voice feature

说话人语音特征的集合。

3.3.28

声学特征 acoustic feature

语音的物理学特性,如基频、共振峰、振幅、谐波结构等。

3.3.29

视频文件 audio/video file

存储图像数据的数字文件,包含声音信息。

3.3.30

视听资料 evidence of audio/video material

通过录音、录像及其他方式记录储存的能够证明案件客观事实的信息及其载体。

3.3.31

数据只读接口 data read-only interface

集 IDE、SATA、SAS、SCSI、USB
以及存储卡等各种介质写保护一身的数据接口工具。

3.3.32

数字化 digitization

将模拟信号转换为数字模式的过程。

3.3.33

数字音频接口 digital audio interface

为了在不同功能的数字音频设备之间互连及进行数字信息传输,对数字信号的采样频率、编码格式

和传送方式等所规定的统一规范或标准。

3.3.34

说话人之间的差异 inter-speaker variation

不同说话人之间存在的语音特征的本质差异。

3.3.35

说话人自身差异 intra-speaker variation

说话人自身因情绪、健康状态、环境以及时间间隔等因素引起的某些语音特征的变化。

3.3.36

听觉检验 auditory analysis

通过听辨对检材语音和样本语音进行分析比较,判断两者相似或差异的过程。

3.3.37

同源性鉴定 origin identification

通过检验判断不同音频是否出自同一音源。

3.3.38

微型盒式录音带 microcassette

带盒尺寸为50 mm×33mm×8mm, 磁带宽为3.81 mm 的盒装录音带。

3.3.39

微型盒式录音机 microcassette recorder

使用微型盒式录音带的录音机,录放音带速一般有1.2 cm/s 和2.4 cm/s
两种可调。

GB/T 35048—2018

3.3.40

伪装语音 disguised voice

说话人故意采取各种方法发出的异于其正常说话的语音。

3.3.41

样本 known voice sample

用于比对鉴定的音频资料。

3.3.42

样本语音 known voice

与检材语音进行比对检验的语音。

3.3.43

移动设备识别码 International Mobile Equipment
Identity Number;IMEI

国际移动设备的唯一识别码(身份码)。

注:由15位数字组成。 IMEI 存储在机身内。

3.3.44

音频文件 audio file

存储声音数据的数字文件。

3.3.45

音频信号提取 audio extraction

将影音文件中的音频分离提取出来的过程。

3.3.46

音频资料 audio material

运用现代科学技术手段,以录音、录像等方式记录并储存的有关案件所涉客体的声音证据。

3.3.47

音频资料复制件 copy of audio material

采用转录、采集、拷贝等方式复制的录音、录像资料。

3.3.48

语音工作站 voice work station

用于声纹检验的专用计算机系统。

3.3.49

语音人身分析 speaker profiling

从语音、词汇和语法等方面进行综合分析,对说话人的籍贯(或长期居住地)、性别、年龄、文化程度、

职业等特征进行分析刻画。

3.3.50

语音同一认定 voice identification

通过对不同的音频资料中特定说话人的语音进行鉴定,判断两者是否为同一人语音。

3.3.51

原始录音 original audio recording

事件发生时用特定设备和介质生成的音频资料。

3.3.52

噪音分析 noise analysis

通过对检材录音的背景噪音进行分析,判断检材的录音环境、时间、地点等检验意见的过程。

GB/T 35048—2018

3.3.53

只读设备 read-only device

对接入的存储介质具有写保护功能的设备。

3.3.54

主叫方 calling party

通话双方主动发起呼叫的一方。

GB/T 35048—2018

延伸阅读

更多内容 可以 GB-T 35048-2018 法庭科学语音及音频检验术语. 进一步学习

联系我们

GB-T 42854-2023 民用飞机客户培训飞行模拟机通用技术规范.pdf